22 research outputs found
GeLexi project : sentence parsing based on a GEnerative LEXIcon
The principal aim of our research team, called GeLexi, is to legitimate a new sort of generative grammar via verifying its computational implementability. This grammar is more radically "lexicalist" than any earlier one: no phrase structure trees are generated, but word order is accounted for by means of ranked parameters. Another novelty is the extension of "total lexicalism" to morphology: lexical items are assigned not to words but to morphemes. Our parser, in accordance with the basic task of every generative grammar, decides whether a sentence is grammatical, and if it is, then provides a morphophonological analysis, a compilation of grammatical relations, and two kinds of semantic representations. At the end we show some examples to demonstrate our procedures, among them a sentence containing the conjunction Ă©s 'and', which is our latest development
Az internetes keresési kifejezések tudatelméleti összefüggései
Tanulmányunkban azt térképezzük fel, vajon a tudatelmélet szintjei hogyan befolyásolják a kereső-kifejezések megválasztását az internetes keresésben. Elsősorban arra koncentrálunk, hogy a tudatelmélet szintjei összefüggésbe hozhatók-e a kereső-kifejezés nyelvi megformáltságával (például főnévi vagy igei természetű-e). A kutatásunkhoz óvodások körében végeztünk felméréseket. Az ismert tudatelméleti tesztek felvétele után egy általunk kidolgozott eszközzel vizsgáltuk a kereső-kifejezések megválasztását
GeLexi terv (lexikalista nyelvtan Ă©s diskurzusreprezentáciĂłs szemantika számĂtĂłgĂ©pes implementáciĂłval) = GeLexi project (lexicalist grammar and discourse representation semantics with computational implementation)
A projektben elmĂ©leti Ă©s alkalmazott nyelvĂ©szeti cĂ©lok fonĂłdtak össze, elválaszthatatlanul: a felĂ©pĂtendĹ‘ grammatikát a számĂtĂłgĂ©pes implementálhatĂłság volt hivatva legitimálni, mĂg másfelĹ‘l minden nyelvĂ©szeti ötlet azt a cĂ©lt is szolgálta, hogy minĂ©l jobb, minĂ©l többfĂ©le cĂ©lra felhasználhatĂł nyelvelemzĹ‘ rendszerĂĽnk legyen. Az elmĂ©leti kutatások egy rĂ©sze a Kamp-fĂ©le DRT diskurzusszemantikai megközelĂtĂ©sĂ©nek a továbbfejlesztĂ©sĂ©re irányult. SikerĂĽlt kidolgozni egy ReALIS nevű elmĂ©letet (kölcsönös Ă©s Ă©lethossziglani interpretáciĂłs rendszer), amelynek elĹ‘nyös vonásai mellett számos publikáciĂłban Ă©rveltĂĽnk sokfĂ©le leĂrási terĂĽleten (hatĂłköri többĂ©rtelműsĂ©gek, koreferencia, az igazságĂ©rtĂ©kelĂ©s általánosĂthatĂłsága, vonzatszerkezet-változás, aspektus). A másik elmĂ©leti pillĂ©rt a totális lexikalizmus ötletĂ©nek a kidolgozása jelentette; a kifejlesztett GASG (generatĂv / általánosĂtott argumentumszerkezet-nyelvtan) elĹ‘nyös vonásait szintĂ©n számos leĂrási terĂĽleten bemutattuk (kompozicionális kompatibilitás a DRT-vel, magyar morfolĂłgia, szabad szĂłrend Ă©s scrambling, "eltűnĹ‘" nĂ©velĹ‘k). Ami az alkalmazási terĂĽletet illeti, több számĂtĂłgĂ©pes nyelvĂ©szeti feladat esetĂ©ben megmutattuk, hogy elmĂ©leti ötleteink Ă©letkĂ©pesek (mondatelemzĂ©s, jelentĂ©sábrázolás, gĂ©pi Ă©s gĂ©ppel segĂtett fordĂtás, informáciĂł-feltárás). | In this project theoretical and applied linguistics aims have been combined: on the one hand, the grammar to be worked out has been intended to be legitimized by computational implementability, and on the other hand, each linguistic idea has been devoted to serve the purpose of creating parsers and different parser-based linguistic softwares. The one pillar that our theoretical researches rely on is developing the discourse-semantic approach of Kamp?s DRT. We could work out a theory called ReALIS (REciprocal And Lifelong Interpretation System) whose advantageous features we have argued for in several areas of linguistic description (scopal ambiguities, coreference, generalizability of truth-conditional evaluation, argument-structure changes, aspect). The other theoretical pillar is the principle of ?total lexicalism?: we have worked out a grammar called GASG (Generative / Generalized Argument Structure Grammar) as its model. We have also published our results in different areas of linguistic description (compositional compatibility with DRT, Hungarian morphology, free word order and scrambling phenomena, ?disappearing? articles). As for applications, we have pointed out in the case of more computational linguistics tasks that our theoretical ideas are viable (parsing, representing meaning, machine (-aided) translation, information extraction)
Az örömtĹ‘l, örömbĹ‘l, örömĂ©ben : a mentális állapotot mint okot megjelenĂtĹ‘ konstrukciĂłk
Tanulmányunkban a mentális állapotot mint okot megjelenĂtĹ‘ konstrukciĂł ([Nmental-state.CASE]cause) három ragos nĂ©vszĂłi változatát elemezzĂĽk hasonlĂłságaik Ă©s kĂĽlönbsĂ©geik szempontjábĂłl. A szerkezeteket korpuszvezĂ©relt kvalitatĂv eljárással elemezzĂĽk: egy, a testvĂ©r-konstrukciĂłk jelentĂ©sĂ©re Ă©s használatára kiterjedĹ‘ vizsgálattal, valamint szintaktikailag, kĂĽlönös tekintettel arra, hogy a nĂ©velĹ‘ meglĂ©te vagy hiánya hogyan befolyásolja a DP projekciĂł felvĂ©telĂ©t Ă©s a referenciális viszonyokat. Azt állĂtjuk, hogy csak a három konstrukciĂł összehasonlĂtĂł elemzĂ©sĂ©vel lehet releváns következtetĂ©seket levonni az egyes változatok szerkezetĂ©re vonatkozĂłan. Kutatásunk eredmĂ©nye, hogy a három konstrukciĂł az oksági viszonyt eltĂ©rĹ‘ jelentĂ©smozzanattal reprezentálja (kiváltó–elĹ‘idĂ©zĹ‘ ok; kĂ©sztetĂ©s–motiváciĂł; háttĂ©r–hatás), Ă©s ennek következmĂ©nye, hogy ugyan mindhárom tartalmaz egy meghatározott thematikus szerepű „alanyt”, amelynek az oksági összefĂĽggĂ©s miatt a tagmondatban kell megtalálnia az antecedensĂ©t, a három konstrukciĂł „alanyára” Ă©s a bennfoglalĂł mondat igĂ©jĂ©re azonban az eltĂ©rĹ‘ jelentĂ©smozzanat más-más restrikciĂłt Ăr elĹ‘. Ha a szerkezetben van birtokos szemĂ©lyrag is, akkor az antecendensre nemcsak szemantikai, hanem morfoszintaktikai megkötĂ©sek is vonatkoznak
GeLexi projekt : GEneratĂv LEXIkonon alapulĂł mondatelemzĂ©s
A 2001-ben PĂ©csett alakult GeLexi kutatĂłcsoportunk1 kiindulĂł cĂ©lja a számĂtĂłgĂ©pes implementálás rĂ©vĂ©n valĂł legitimálása egy olyan grammatikának, amely a generatĂv nyelvĂ©szeti kutatásokban a hatvanas Ă©vektĹ‘l egyre erĹ‘södĹ‘ lexikalista tendenciát a „vĂ©gsĹ‘kig” fokozza; lemond a frázisstruktĂşra-Ă©pĂtĂ©srĹ‘l, miközben a szĂłrendrĹ‘l mĂ©gis számot ad, rangsorolt szomszĂ©dossági követelmĂ©nyek segĂtsĂ©gĂ©vel. Másik Ăşjdonsága a „totális lexikaiizmus” kiteljesztĂ©se a morfolĂłgiára is: nem a szavakhoz, hanem a morfĂ©mákhoz tartoznak a minden grammatikai szintrĹ‘l egyidejűleg informáciĂłt hordozĂł lexikai egysĂ©gek amelyek oly mĂłdon „szerelik össze magukat” a mondatelemzĂ©s során, hogy az is eldĹ‘l, mely elemek Ă©pĂĽlnek össze szĂłvá, Ă©s melyek alkotnak (egymás .közelĂ©ben” maradĂł) kĂĽlön szavakat NyelvelmĂ©leti törekvĂ©seink gyakorlati hozadĂ©ka egy folyamatos fejlesztĂ©s alatt állĂł program, amely egy (jelenleg magyar vagy angol) szĂłsoron elvĂ©gzi a „generatĂv grammatikai alapfeladatokat”: eldönti, hogy jĂłl formált szavakbĂłl áUĂł grammatikus mondattal áU-e szemben, majd (a pozitĂv esetben) kĂ©tfĂ©le diskurzus-szemantikai elemzĂ©st kĂnál. E cikkben Ă©s kötĹ‘szavas mondatok elemzĂ©se szemlĂ©lteti majd eljárásainkat
GeLexi projekt : gĂ©pi fordĂtás totálisan lexikalista alapokon
CikkĂĽnkben a gĂ©pi fordĂtás egy Ăşj (totálisan lexikalista) megközelĂtĂ©sĂ©t mutatjuk be, miután röviden ismertettĂĽk a GASG implementáciĂłján alapulĂł elemzĹ‘nket, amelynek kĂ©tirányĂş alkalmazásával (egy speciális, Ăşn. kopredikáciĂłs hálĂłzaton keresztĂĽl) valĂłsĂthatĂł meg a fordĂtás. Programunk Ăşjdonsága többek között abban rejlik, hogy a szintaktikai mellett szemantikai reprezentáciĂłt is kĂ©pes társĂtani a mondatokhoz (ezáltal gĂ©ppel segĂtett fordĂtáskĂ©nt is felfoghatĂł); továbbá hogy nem nyelv-specifikus, ezĂ©rt bármely nyelvrĹ‘l kĂ©pes bármely másikra fordĂtani, ha azok lexikai egysĂ©geit (minden tulajdonságukkal egyĂĽtt) az elemzĹ‘ tartalmazza. Eddig elĂ©rt eredmĂ©nyeinket (magyar Ă©s angol mondatok egy körĂ©nek elemzĂ©se Ă©s fordĂtása) pĂ©ldákon keresztĂĽl is szemlĂ©ltetjĂĽk
LiLe projekt : adatbázis mint "dinamikus korpusz"
A LiLe-projekt fĹ‘ cĂ©lkitűzĂ©se egy nyelvĂ©szeti lexikon MSSQL-adatbázis-formában valĂł felĂ©pĂtĂ©se. A kidolgozott adatbázis-struktĂşránk legfontosabb tulajdonsága, hogy a grammatika kĂĽlönbözĹ‘ szintjein lĂ©tezĹ‘ szabályokat a morfĂ©mákkal azonos mĂłdon tárolja, Ăgy valĂłsĂtva meg a legteljesebb lexikaiizmust. A projektĂĽnk a grammatikus szĂłalakok Ă©s mondatok elemzĂ©sĂ©re Ă©s generálására vállalkozik. Ezeknek az eszközöknek a segĂtsĂ©gĂ©vel hozunk lĂ©tre egy olyan korpuszt, amely az összes lehetsĂ©ges szĂłalak Ă©s mondat generálására alkalmas. A generálási algoritmus kiválasztott adatbázisbeli elemeken (morfĂ©mákon Ă©s szabályokon) hajthatĂł vĂ©gre, Ăgy kĂvánjuk támogatni mind a nyelvĂ©szeti kutatásokat, mind a magyar nyelv oktatását. Ezt a speciális cĂ©lokat megvalĂłsĂtĂł Ă©s sajátos felĂ©pĂtĂ©sű nyelvĂ©szeti lexikont nevezzĂĽk dinamikus korpusznak